Perubahan Paradigma: Dari Model Khusus Tugas ke LLM

Evolusi NLP: AI Terpecah ke Model Dasar

AI Terpecah: Era yang ditandai oleh arsitektur neural terpisah dan khusus yang dirancang untuk tugas-tugas individu seperti pelabelan urutan atau klasifikasi.
Model Dasar: Arsitektur transformer terpadu dan monolitik yang menangani semua masalah bahasa sebagai urutan teks-ke-teks generatif $x \rightarrow y$.

Konsolidasi Arsitektur: Secara historis, NLP membutuhkan pipeline khusus (Bi-LSTM untuk NER, CNN untuk sentimen). LLM menggabungkan silo-silo ini menjadi satu tulang punggung tunggal di mana bobot yang sama digunakan untuk setiap tugas.
Antarmuka Terpadu: LLM menggantikan "head output" khusus (misalnya, Softmax 3-kelas) dengan antarmuka berbahasa alami. Masukan dan keluaran selalu string, memungkinkan model untuk memahami tujuan daripada format.
Transfer Pengetahuan: Model tradisional adalah "lembar kosong" untuk setiap tugas. LLM memberi prioritas pada Generalisasi Pertama, di mana tugas-tugas tertentu hanyalah aplikasi dari representasi internal bahasa yang sudah ada dan kuat.

Sebelum 2018: Pemisahan tugas mengharuskan melatih model yang berbeda dengan fungsi loss yang berbeda $\mathcal{L}_{task}$.
Era Modern: Paradigma "TeKS-ke-TeKS" memungkinkan satu model (misalnya, Llama-3) untuk beralih tugas melalui pemeringkatan nol-percobaan atau sedikit percobaan.

Perbandingan Implementasi Python